Extraktion von semantischen Relationen aus natürlichsprachlichem Text mit Hilfe von maschinellem Lernen

نویسنده

  • Christian Biemann
چکیده

Zusammenfassung: Inhalt der vorliegenden Arbeit ist die Entwicklung eines Lernverfahrens, das aus großen Textkorpora semantische Relationen automatisch extrahiert. Den Kern des Verfahrens bildet die Iteration von Suchschritt und Verifikationsschritt, in denen in gesuchter Relation stehende Wörter gefunden und überprüft werden. Auf diese Weise ist es möglich, mit wenigen bekannten Wörtern eine große Anzahl in derselben Relation stehende Wörter zu gewinnen. So können mit wenig Aufwand große Listen von Wörtern erstellt werden, die in einem semantischen Zusammenhang stehen. Nach der Skizzierung des Algorithmus werden theoretische Vorhersagen bezüglich der für das Verfahren geeigneten Relationen getroffen, sowie der Ablauf modelliert. Einige mit einer Implementierung des Verfahrens erzielte Ergebnisse werden für die Relation der Personennamen vorgestellt, evaluiert und diskutiert, des Weiteren werden Ausblicke und Verbesserungsmöglichkeiten angegeben.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Fachdatenbanken und Internetquellen: Rechercheüberstieg durch Anfragetransfer

Die Sonderfördermaßnahme CARMEN zielte unter anderem darauf ab, die Erweiterung von Recherchen in bibliographischen Fachdatenbanken ins Internet zu verbessern. Dabei war das Problem der semantischen Heterogenität zu behandeln, die durch unterschiedliche Inhaltserschließung in verschiedenen Datenbeständen auftritt. Dazu wurden verschiedene Ansätze wie Metadatenextraktion aus Internetquellen und ...

متن کامل

Generierung und Anfragebearbeitung von hierarchischen XML-Sichten auf relationale Datenbanken

In diesem Beitrag wird beschrieben, wie aus einem relationalen Datenbankschema äquivalente XML-Dokumentbeschreibungen in XMLSchema generiert werden können, die implizite hierarchische Strukturen aus der Datenbank möglichst explizit darstellen. Dabei wird ausgenutzt, dass Primärund Fremdschlüssel sowie Eindeutigkeitsund Nullwert-Bedingungen in XMLSchema übernommen und dass Datentypen des Datenba...

متن کامل

Generierung semantischer Felder auf der Basis von Frei-Texten

den Anspruch, genau die gleichen Head/ModifierRelationen automatisch zu finden, wie durch menschliche Intuition. Auf die RelationenTypes bezogen müßte die Fehlerrate wesentlich kleiner sein, wenn nur die häufigen Head/Modifier-Relationen berücksichtigt werden. Die Behandlung der Konjunktionsrelationen (s. Abb. 3) wurden ebenfalls zum Zweck der Phrasennormalisierung entwickelt. Bei der Extraktio...

متن کامل

Automatische Extraktion von Fachterminologie aus kunst-historischen Volltexten

Mit Hilfe eines algorithmisch arbeitenden Verfahrens können fachterminologische Mehrwortgruppen aus elektronisch vorliegenden Texten identifiziert und extrahiert werden. Inhaltlicher Schwerpunkt stellt die Einbindung von Funktionswörtern des deutschen Sprachgebrauchs in den Extraktionsalgorithmus dar. Als Datengrundlage dieser Arbeit dienten kunsthistorische Lexikonartikel des Reallexikons zur ...

متن کامل

Räumliche Inferenz mit Lern- und Optimierungsverfahren

In der Dissertation „Anwendung von Verfahren des Maschinellen Lernens und von Evolutionären Algorithmen bei der räumlichen Inferenz“ [2] werden verschiedene Ansätze zum Lösen der bei dem verwendeten metrischen Ansatz zur räumlichen Inferenz entstehenden Constraintsysteme vorgestellt und verglichen. Neben aktuellen ConstraintsolvingAlgorithmen wurden Verfahren aus den Bereichen Maschinelles Lern...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • LDV Forum

دوره 18  شماره 

صفحات  -

تاریخ انتشار 2003